OpenAI Five
2018年
に
OpenAI
から公開された
Dota 2
において
プロ
を打倒できるとした
ゲームAI
ディープニューラルネットワーク
に
LSTM
を用いて,
PPO
という
強化学習
の
アルゴリズム
を用いた5つの
エージェント
のチームからなる.
膨大な
計算資源
と
学習時間
に特徴がある.
10ヶ月くらい
強化学習
したらしい.